خوشه بندی داده های طولی بر اساس مدل های آمیخته گاوسی و ناگاوسی دم کلفت

پایان نامه
چکیده

چکیده امروزه جمع آوری اطلاعات از طریق کامپیوتر و اینترنت باعث تولید زیاد داده شده است. کسب دانش از مجموعه داده های بزرگ ممکن است پیچیده و در مواردی غیر ممکن به نظر آید، بنابراین نیاز به داشتن روش ها و تکنیک هایی برای تلخیص و استخراج اطلاعات از این نوع داده ها ضروری است. یکی از تکنیک های مرسوم برای این کار خوشه بندی است. اساس این روش خلاصه کردن یک مجموعه از مشاهدات در تعداد محدودی گروه است، یا به طور هم ارز ایجاد یک افراز روی مجموعه ای از مشاهدات در داخل چند گروه جدا از هم به طوری که مشاهدات داخل هر گروه مشابه یکدیگر می باشند و مشاهداتی که در گروه های متفاوت قرار گرفته اند شباهت کمتری دارند. نوع خاصی از داده هایی که در چند سال اخیر بیشتر به آن توجه شده است داده های طولی می باشند که در واحدهای متوالی زمان از واحدهای مشخص به دست می آیند. هدف این پایان-نامه ارائه روشی برای خوشه بندی مدل-پایه برای داده های طولی است. برای این منظور داده های طولی با استفاده از توزیع های گاوسی و ناگاوسی با در نظر گرفتن ساختار کوواریانس مناسب برای این داده ها، خوشه-بندی می شوند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

خوشه بندی پروفایل های طولی با استفاده از مدل های اثرات آمیخته ناپارامتری و نیمه پارامتری

مطالعات طولی یکی از شاخه­های علم آمار است که در ارتباط با مجموعه داده­هایی است که در طول زمان اندازه­­گیری می­شوند. یکی از حوزه­های مطالعاتی داده­های طولی در پزشکی و ژنتیک است. از آنجا که خوشه­بندی داده­های بیان ژن دوره­ای زمانی بافت­های سلولی افراد مختلف به خوشه­های همگن مفید است و کسب دانش از این مجموعه­ی عظیم داده­ها ممکن است پیچیده و در مواردی غیر ممکن به­نظر آید، از این­رو شناسایی روش­هایی...

متن کامل

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

متن کامل

تحلیل دوسطحی با اثرات تصادفی چوله نرمال و مدل بندی داده های طولی

مدل سازی داده های دوسطحی با فرض نرمال بودن مولفه تصادفی و خطا انجام می شود. عدم برقراری این فرض باعث استنباط غلط در مورد پارامترهای مدل می گردد. در این مقاله، استفاده از خانواده توزیع چوله نرمال که خانواده ای انعطاف پذیرتر از توزیع نرمال است مطرح می شود. سپس در یک مطالعه شبیه سازی نشان داده می شود عدم در نظر گرفتن چولگی مثبت (منفی) در مدل باعث بیش برآوردی (کم برآوردی) عرض از مبدا و کم برآورد...

متن کامل

خوشه بندی پروفایل های طولی با استفاده از اسپلاین تاوانیده و مدل اثرات آمیخته

مطالعات طولی یکی از شاخه های علم آمار است که در ارتباط با مجموعه داده هایی است که در طول زمان اندازه گیری میشوند. یکی از حوزههای مطالعاتی دادههای طولی در پزشکی و ژنتیک است. با توجه به افزایش بیماریهایی از جمله سرطان که عامل مهمی از مرگ و میرها را تشکیل میدهد، شناسایی، درمان و پیشگیری این نوع بیماریها از طریق خوشه بندی داده های بیان ژن دورهای زمانیِ سلولهای سرطانی افراد مختلف به خوشه های هم...

15 صفحه اول

طبقه بندی تصاویر فراطیفی با استفاده از مدل آمیخته ی گاوسی و الگوریتم نمونه گیر گیبز

با پیشرفت­های فناوری سنجش از دور و تولید داده­های فراطیفی با اطلاعات طیفی فراوان، استفاده از این داده­ها جهت مطالعه دقیق پدیده­ها به سرعت در حال گسترش است. تصاویر فراطیفی به دلیل نمایش گسترده خصوصیات طیفی عوارض و پدیده­های سطح زمین در بسیاری از علوم زمین مورد توجه قرار گرفته‏‏اند. یکی از مهمترین کاربردهای تصاویر فراطیفی، طبقه­بندی آنها و تولید نقشه­های پوشش زمینی بدون نیاز به داده­های واقعیت زم...

متن کامل

مدل بندی و تحلیل داده های فضایی ناگاوسی براساس آمیختن مقیاسی از یک میدان تصادفی چوله گاوسی بسته

در رگرسیون کلاسیک و فضایی معمولا فرض می شود که داده های تحت بررسی نرمال هستند. اما در عمل با موارد متعددی مواجه می شویم که در توزیع داده ها شواهدی از چولگی یا سنگینی دم ها مشاهده می شود. در اینگونه مسائل، خانواده توزیع های آمیخته مقیاسی از چوله نرمال روش مناسبی برای مدلبندی داده ها فراهم می سازد. در این رساله با هدف ارائه مدل های جدید و انعطاف پذیر که با مشکلات مدل های موجود مواجه نباشد، ابتدا...

15 صفحه اول

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده علوم ریاضی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023